查看原文
其他

科研 | Immunity:纵向多组学分析表明巨核细胞、红细胞和浆母细胞反应是重症COVID-19的特征

微科盟周仙杰 代谢组metabolome 2022-09-23

点击蓝字↑↑↑“微科享”,轻松关注不迷路

编译:微科盟周仙杰,编辑:微科盟Tracy、江舜尧。

微科盟原创微文,欢迎转发转载。

导读

重症COVID-19细胞特征的时间分辨率分析,有助于我们对COVID-19异常免疫反应的理解和筛选COVID-19不同结局的预测因子。本研究使用两个中心的14例患者队列进行了纵向多组学研究,分析了最多5个时间点采集的外周血样本的转录组、DNA甲基化组和单细胞转录组(>358,000个细胞,包括BCR谱),并在两个独立的COVID-19患者队列中进行了验证。重症COVID-19的特征是增殖的、代谢异常活跃的浆母细胞增多。在危重症患者中,本研究还发现了干扰素激活的循环巨核细胞增多和以缺氧信号为特征的红细胞生成增加,巨核细胞和红系细胞来源的共表达模式可预测疾病的致命结局。本研究表明SARS-CoV-2感染的广泛细胞效应已不仅限于适应性免疫细胞,这为筛选COVID-19患者的生物标志物和靶向治疗提供了一个新的切入点。


论文ID


原名:Longitudinal Multi-omics Analyses Identify Responses of Megakaryocytes, Erythroid Cells, and Plasmablasts as Hallmarks of Severe COVID-19译名:纵向多组学分析表明巨核细胞、红细胞和浆母细胞反应是重症COVID-19的特征
期刊:Immunity
IF:22.553发表时间:2020.12通讯作者:Philip Rosenstiel
通讯作者单位:基尔大学临床分子生物学研究所

实验设计



实验结果


1. 研究设计


本研究对来自德国2所大学医院(科隆和基尔)的13例COVID-19住院患者的多达5份纵向外周血样本、外加1例痊愈对照患者样本,应用了多组学方法,进行了平行scRNA-seq (10xGenomics)、单细胞B细胞受体(BCR)分析、大量mRNA测序(RNA-seq)、BCR扩增子测序和多色流式细胞术分析,并对7例患者样本进行了基于阵列的DNA甲基化分析和多因子ELISA分析(图1A)。所有患者在入院时被招募,在第0、2、7、10、13天和/或出院时采集样本。其中,有3例患者被诊断为急性呼吸窘迫综合征(ARDS),其中两人有致命的病程,5例患者参与本研究后接受了瑞德西韦治疗,患者的人口学特征和临床特征被记录在附表中,14例年龄和性别匹配的健康对照被平行处理。为了描述随着时间推移的异质性疾病轨迹,我们应用了改良的WHO顺序量表(WHO, 2020),另外纳入了一些炎症标志物(血清c反应蛋白[CRP],血清IL-6和铁蛋白),根据患者的病程,使用量表评分对患者进行分类(图1B和1C)。    

图1 用于疾病轨迹分析的疾病阶段的临床定义
(A)研究队列的图解概述。(B)疾病阶段的概念设定。根据炎症标志物和通气需求(基于WHO顺序量表)定义临床疾病分期(人为假定的不同时段),不同临床疾病分期可以反映即时的疾病严重程度,并区分疾病的渐进阶段和恢复期。Hosp表示住院。(C)队列1研究概况。所有患者按首次入院日期排序,方框表示COVID-19相关症状出现的时间、框架表示住院治疗天数(颜色表示疾病分期)、白色圆圈表示采样的时间、三角形符号表示插管和拔管。

 

2. scRNA-seq分析识随COVID-19疾病轨迹而变化的细胞


本研究首先分析了358,930个细胞的scRNA-seq数据,每个样本平均10,900个细胞(图2A),每个患者至多4个纵向样品被分析。我们使用统一流形逼近与投影(UMAP)来可视化细胞群的结构(图2B-2E),基于图聚类识别出数据集中37个不同的细胞簇,根据每个簇的特征基因对细胞类型进行分类,并通过参考转录组进行确认(图2B、2C)。在UMAP中,除了单核细胞亚群具有较高程度的个体间异质性外,来自单个患者的细胞均匀分布(图2D、2E),而不同时间点计数,发生变化的细胞类型,有单核细胞、增殖的淋巴细胞和自然杀伤(NK)细胞(图2E、2F)。

我们观察到典型CD14+单核细胞数量增加,尤其是在恢复期,而非典型CD16+单核细胞数量增加是在疾病分期的2和3期;此外,我们证实了在危重症阶段(疾病分期2期)人类白细胞抗原DR(HLA-DR)表达抑制。CD4+淋巴细胞减少,但不如其他数据集明显。我们还注意到,从渐增期到恢复期早期,浆母细胞(PB)比例增加,而B细胞在渐增期和复杂期减少。值得注意的是,我们发现COVID-19患者外周血中多种骨髓源性前体细胞类型的存在有所增加,更重要的是,在整个病程中,巨核细胞(MK)比例升高(图2F)。为了确定可能被SARS-CoV-2直接感染的潜在细胞群,我们统计了数据集中ACE2 mRNA的数量,其在所有细胞群中都低于检测限(<7 reads)。

相对的细胞比例与临床活动参数及多重血清ELISA的相关分析表明,PB的比例与血清中肿瘤坏死因子(TNF)、IL-10和IL-21的含量相关,IL-21很有可能是一种通过STAT3和BLIMP-1(也称为PRDM1)参与B细胞向PBs分化的因子。骨髓前体细胞的增加与IL-33(一种参与调节造血干细胞再生的Th2细胞因子)的数量增加有关,而MKs的升高与炎症参数升高有关,如血清CRP、IL-6和IFN-a(图2G)。

图2 随COVID-19疾病轨迹而变化的细胞

(A)工作流程示意图。(B) UMAP展示的所有合并样本的细胞类型。通过聚类基因特征鉴定出12种细胞类型,共描绘了358,930个细胞。(C)点图显示,细胞类型特异性特征基因。根据10个最典型的基因的表达量来筛选基因。不同颜色表示,基因表达增加(红色)或减少(蓝色),点大小代表每组表达相应基因的细胞数量。(D) UMAP展示的所有合并样本。细胞根据样本着色。样本命名依据患者ID(001-014)和样本采集时间点,第1天(入院后TA)、第3天(TA2)、第8天(TB)、第11天(TB2)、第14天(TC)、第20天(TE)。(E) UMAP展示的所有合并样本对应的疾病分期,颜色表示假定的不同疾病分期。(F)按疾病分期分组的细胞比例。细胞比例用点表示,是指细胞占单个样本细胞总数的百分比,横条表示平均值。不同颜色表示不同疾病分期。COVID-19疾病分期间比较的p值基于纵向线性混合模型,健康对照与COVID-19样本比较的p值基于Mann-Whitney检验。(G)细胞特异性比例与包含常规试验和多重ELISA在内的临床参数的相关性热图。Spearman相关系数*p < 0.05,**p < 0.01,***p < 0.001。颜色强度对应相关系数。缩写:DC树突状细胞、PB浆母细胞、MK巨核细胞、HSC造血干细胞、MEP巨核-红细胞祖细胞、CMP常见的骨髓祖细胞、GMP粒细胞-单核细胞祖细胞。

 

3. 全血转录组特征随COVID-19疾病轨迹动态变化


为了在更高的时间分辨率描述SARS-CoV-2感染的转录组特征,我们进而在单细胞数据集中筛选出相应的细胞类型,我们分析了13个住院患者多达5个时间点的全血转录组数据,并与14名健康对照进行特征信息对比(图3A)。主成分分析显示,健康对照与COVID-19患者在第一主成分(PC1)上存在差异(图3B)。在与对照及每个疾病轨迹分期之间的配对比较分析显示,健康对照和COVID-19患者之间的差异表达基因(DEGs)共有5915个,大多数DEGs在COVID-19患者中的表达水平高于健康对照(图3C)。值得注意的是,早期的改变包括免疫球蛋白转录产物(IGHA1、IGHG1)和乳铁蛋白(LTF)的增加,然而,在整个病程中,编码Th17特异性转录因子(TF)和HLAII类转录产物的RORC mRNA水平下降。

接下来,我们使用ImpulseDE2来构建差异表达基因(DEG)随时间推移的个体差异模型。考虑到3名达到疾病2期的患者中有2名在达到这个时间点后不久死亡,且没有经历恢复期病程,本次分析排除这一类别,其仅用于对比经鉴定的转录本。在整个疾病轨迹中,我们鉴定出935个遵循脉冲样进展模式的DEGs(图3D);在疾病1期,参与IL-1β和血管舒张信号传导的基因高度表达。在疾病1、3、4期,编码核糖体结构蛋白的转录本普遍减少,这可能反映了I型干扰素对蛋白质合成的普遍抑制,而在疾病活跃高峰期,IFN相关转录本显著增加,但在危重症阶段受到抑制(图3D),这证实了先前的报道。在疾病1、3和4期,参与骨髓细胞介导免疫和中性粒细胞脱颗粒的转录物略微升高,但在疾病2期时显著升高。值得注意的是,在疾病5和6期,可以检测到红细胞分化的强烈信号(如HBD、OPTN和FIS1),暗示了缺氧反应。

我们利用基因集资源DoRothEA通过富集的调控子分析来推断转录因子(TF)的活性,疾病活跃期的TFs与炎症和IFN信号通路(如IRF1和STAT3)以及缺氧信号通路(HIF1A)有关。单细胞分析的第一部分辅助性的IL-21-PB轴鉴定,预测到PRDM1(由BLIMP-1编码)在危重期和恢复期两个时间点都会显著活跃。以REACTOME数据库作为参照,所有活跃的TFs的超几何检验显示,“细胞分化通路”(q=0.03)和“MK发育和血小板生成”(q=0.05)富集。通过使用标记的和定向的蛋白质-蛋白质相互作用,利用基因表达变化的上游网络拓扑结构,本研究显示MAPK3(也称为ERK1)和MAPK1(也称为ERK2)在所有疾病分期中具有最高的中心性。我们进一步使用各自的DEGs构建了每个疾病分期的代谢模型,并发现与恢复期和健康个体相比,炎症性疾病状态可预测到更高数量的代谢活性通路。我们还研究了存在病毒序列片段的大量RNA数据集,但没有在任何样本中检测到相关 (数量>10)的病毒序列,常规实时荧光定量PCR (E基因和S基因扩增子)阴性也证实了这一发现。 

图3 COVID-19患者全血基因表达的动态变化

(A)工作流程示意图。(B)基于所有基因表达的所有对照组和COVID-19样本的PCA图。样本用它们的疾病分期进行颜色编码,并根据患者或个人ID进行标记。(C)每个COVID-19的疾病分期(x轴)与对照组之间的差异基因的差异倍数log2值(y轴)。颜色表示基因表达增加(红色)或减少(蓝色),点大小代表统计显著性(调整后p值)。点的透明度表示差异表达显著的基因的比较次数。表达增加和减少的基因数分别写在图的顶部和底部。(D) COVID-19疾病分期(疾病1、3、4、5和6期)前500位纵向DEGs的热图。疾病2期和对照组的基因表达,分别在热图的右侧和左侧。热图中显示的是标准化的z值。使用它们的邻接得分作为距离,对基因进行层次聚类。

 

4. 纵向共表达模块识别危重症中受损的IFN反应和血栓及红细胞生成增加的特征


我们利用配对和纵向分析(6,317个基因)结合筛选出的所有差异基因进行加权基因共表达网络分析,分析共确定了10个模块,我们称之为M1-M10,它们在整个COVID-19疾病阶段遵循不同的表达模式(图4A)。我们计算特征基因值,它代表一个模块内所有基因的单一表达谱,以评估模块与scRNA-seq衍生的细胞组成(图4B)和临床参数(图4C)之间的个体相关性。我们使用scRNA-seq数据预测每个模块中关键基因的表达,揭示了细胞类型和不同疾病分期的特异性表达模式。基因集富集分析揭示了在每个模块中富集的生物学过程和通路,转录因子结合位点(TFBS)推断用于描述假定参与的TFs。M2代表I型IFN反应的特征和增殖活性(G2M转变)(图4D),并在IRF1、STAT1和STAT2的结合位点富集。M4与外周血以及D-二聚体中的MK有关,并且具有两个表达峰,分别在危重期(疾病2期)和早期恢复期(疾病4期)。M7包含与血红蛋白生物合成相关的转录本,并与GATA-1和GATA-2的TFBS基序相一致,GATA-1和GATA-2是与红细胞分化相关的TFs。这种双期模式可能与高度急性炎症时的缺氧(第一个高峰)和恢复期停止补充氧气(第二个高峰)有关。总之,患者全血的即时基因表达模式的分析清楚地描述了随着常规疾病轨迹SARS-CoV-2病毒感染的病理生理后果。

图4 差异基因的共表达分析和甲基化变化的整合

(A)利用所有配对和纵向的DEGs构建的共表达模块的组特征基因热图。在每个疾病分期内绘制所有样本的平均特征基因值。基因数量用条形图表示(右)。(B)相关热图,显示基因共表达模块(行)和来自scRNA-seq数据的细胞特异性比例(列)之间的Spearman秩相关系数。Spearman相关系数*p<0.05,** p<0.01,*** p<0.001。颜色强度对应相关系数。(C)相关热图,显示基因共表达模块(行)与临床参数(列)之间的Spearman秩相关系数。Spearman相关系数*p<0.05,** p<0.01,*** p<0.001。颜色强度对应相关系数。(D)点图显示使用GO(生物过程)、Hallmark和KEGG基因集对基因共表达模块的基因集富集分析(GSEA)。点的大小与标准化富集分数(NES)成正比,颜色与错误发现率(FDR)对应。排名靠前的项被可视化。(E)全血EPIC阵列数据分析的工作流程及其与RNA-seq数据的整合。(F)每个COVID-19疾病分期与对照组之间差异显著的DMPs的数量。与对照组相比,COVID-19样本中存在高甲基化(红色)和低甲基化(蓝色)位点。(G)每个疾病分期,前30000个DMPs的比较。垂直条形图表示,特定的DMPs的数量(左),不同疾病分期共享的特定的DMPs的数量(右),点表示不同疾病分期、共享点使用线连接(下)。只显示选定的重叠部分。(H)热图显示在不同COVID-19疾病分期的DMPs中TFBS显著富集(按优势比量化)。排名靠前的TFs被可视化。(I)点图显示DMP-DEG富集的GO项。点的大小与基因比例成正比,颜色与富集的p值对应。排名靠前的项被可视化。

 

5. 全血DNA甲基化分析揭示COVID-19全基因组低甲基化与基因表达相关


表观遗传学改变可能导致全身性炎症的病理生理变化,因此,我们按照图4E所示的工作流程研究了COVID-19病程中的DNA甲基化(DNAm)模式,研究对象为同一组患者(n=6),并将他们与6名年龄和性别匹配的健康对照进行了比较。与健康对照组及不同疾病分期间的配对比较分析鉴定出46071到69733个差异甲基化CpG位点 (图4F和4G);与健康对照相比,COVID-19患者在每个时间点都有较多的低甲基化位点。细胞反褶积分析发现,COVID-19相关的DNAm信号主要来源于粒细胞、B细胞、NK细胞和单核细胞。使用轨迹重叠分析推断差异甲基化TF结合位点,我们在去甲基化区域观察到一个显著过表达的位点CCAAT增强子结合蛋白β(CEBPB)(图4H),它在粒细胞生成和B淋巴细胞向粒细胞分化转移中具有重要作用,这一进程在重症COVID-19中已被提出。

我们采用分级测试方法来鉴定转录组和DNAm特征之间的相互作用(图4E)。为此,我们筛选了所有DEGs各自转录起始位点上游和下游5kb窗口内的差异甲基化位点(DMPs)。在所有3280对DMP-DEG中,68.3%的DMP-DEG在甲基化减少时表达增加,或甲基化增加时表达减少,这与之前的研究结果一致。接下来我们研究了共表达模块M1-M10中DMP-DEG的表达。我们基于秩相关分析发现,在所有模块中都存在DMP-DEG对,并且其在M3和M8中显著过表达。DMP-DEG的基因本体论(GO)富集分析显示,在DEGs中固有免疫相关通路表达增加(例如,TNF和IL-6信号和Toll样受体[TLR]通路),并且鉴定出了与血小板功能和代谢过程(ATP代谢和自噬)相关的基因集(图4I)。DMP-DEG基因会在炎症期(疾病1-4期)增加或恢复期晚期(疾病5和6期)减少,使用scRNA-seq数据,可以在PBs、单核细胞和MKs中识别出更大的DMP-DEG细胞类型特异性簇。

 

6. 在COVID-19疾病轨迹中,浆母细胞和B细胞发生变化


鉴于我们的研究结果显示B细胞随着COVID-19疾病轨迹而改变,接下来,我们更详细地研究了B细胞谱系(图5A)。我们首先在队列1的scRNA-seq数据中提取了22190个被鉴定为B细胞谱系的细胞。UMAP嵌入识别出了两个不同的反映了真实B细胞的大簇,其中包括11,509个记忆B细胞、3,993个初始B细胞、383个过渡期B细胞和6,295个PBs细胞(图5B)。在COVID-19期间,PBs大幅扩大,在高炎症期达到最高水平(图5C)。多色流式细胞术证实CD19+细胞中有大量循环CD27hiCD20-细胞,随着疾病的恢复而下降;同样,初始(CD20+CD27-)和记忆B细胞(CD20+CD27+)早期相对减少(图5D)。在炎症期(疾病1-4期),我们还鉴定出了大量HLA-DR+CD138+双阳性PBs,然而CD138+细胞仅在活跃期大量存在,恢复期不存在,并且82%-98%的CD27hiCD20-细胞仍保持HLA-DR+。值得注意的是,由于PBs对操作非常敏感,我们认识到,与流式细胞术数据相比,针对scRNA-seq和队列2的处理程序减少了完整的PBs数量,但两种方法之间PB数量增加的纵向动态已被保留。

我们可以区分出一个更小的PBs簇,它们表达中性粒细胞相关基因(如ELANE、MPO和CAMP)(图5E)。与之前的研究不同,我们在健康受试者中也发现了这些细胞,但频率较低(图5C)。我们使用monocle3重点关注了过渡期B细胞转变为初始及记忆B细胞的细胞轨迹,其中有一个不同的记忆B细胞簇很可能是CD45RB-细胞(图5F)。我们基于疾病状态追溯PBs进展,发现来自高炎症期的细胞离轨迹根源更远,嗜中性粒细胞样PB细胞与PB轨迹并不连续相连(图5F)。

通过使用重链bulk-seq和scBCR-seq分析不同B细胞的BCR,我们在bulk数据集中共识别出596882个独特的BCR CDR3重链序列,而对于scBCR-seq,我们得到了14,785个细胞的信息。多样性分析显示,升高的克隆性,在早期时间点显著增加,然后在恢复期逐渐减少,直到随访正常化。Bulk BCR鉴定出在记忆B细胞和PBs中IgA+和IgG+的细胞扩增。与记忆B细胞相比,在PBs细胞中IGHA1和IGHG1的表达增加更早。scBCR-seq数据证实了IgA+和IgG+ PBs的扩增。对免疫球蛋白重链可变区(IGHV)家族亚基的分析显示,与对照相比,COVID-19患者特异性可变区占优势,例如疾病期间,PBs和中性粒细胞样细胞中IGHV3-30和IGHV3-23过表达。总之,我们观察到COVID-19中B细胞克隆性增加,并且记忆B细胞和PBs增加,主要由IgA和IgG亚型占主导,并且在病程早期偏向使用IGHV基因。

我们分析了6295个PBs的纵向基因表达谱(图5G)。炎症渐增阶段,COVID-19患者以内质网(ER)应激、蛋白折叠(如XBP1) 和细胞增殖(如PIM2和S100A4)相关的转录本为特征。PBs中存在I型干扰素反应基因(IFI27、IFI6和IFITM1),直到疾病后期(疾病5期),然而,这类基因在危重症(疾病2期)患者PBs中不存在。在疾病中,我们还鉴定出SLC1A4表达增加,SLC1A4是一个潜在的代谢改变的上游调节因子(图5I)。IL-16的高表达是PBs长期恢复的特征之一,也与体液免疫反应启动时CD4+T细胞和血液循环中的树突状细胞(DCs)迁移到淋巴器官的现象相符(图5G)。GO富集分析发现,疾病活跃期未折叠蛋白反应和线粒体ATP合成增加(图5H)。我们通过使用另一种scRNA-seq技术分析独立队列(队列2)中的轻症和重症COVID-19患者的数据,证实了上述的结果。我们从队列2的数据集中提取2263个PBs证实了,与轻症COVID-19患者相比,重症患者的PBs显著增加(整个B细胞谱系中8%vs30%),并且CD38、PIM2、IFI6、XBP1和SLC1A4表达增加,还有类似的GO富集项(Fisher检验,未折叠蛋白反应p=1.80×10-5,线粒体ATP合成p=2.50×10-8)。

PBs可以通过充当营养库来调节免疫应答,因此,我们使用加入约束的模型,从scRNA-seq数据中重构单个细胞的代谢状态。炎症状态下的PBs细胞显示出高代谢活性,只有在疾病恢复后代谢活性才会降低,而记忆和初始B细胞在不同的疾病状态下总体代谢活性没有显著差异。PBs中增加的代谢过程包括氧化磷酸化、乙醛酸和二羧酸代谢、NAD合成以及各种氨基酸代谢途径(甘氨酸、丝氨酸、丙氨酸、苏氨酸、缬氨酸、亮氨酸和异亮氨酸)。我们预测糖酵解在炎症疾病阶段处于低活性状态,而在临床恢复期(疾病6期)具有高活性(图5J)。总之,该分析发现了PBs的广泛激活,并暗示细胞向氨基酸代谢的强烈的免疫代谢转移,这可能导致重症COVID-19所见的免疫病理。

图5 COVID-19疾病轨迹的B细胞谱分析发现浆母细胞改变
(A)工作流程示意图。(B)UMAP展示的B细胞区室亚型,总共描绘了22190个细胞。记忆B细胞(MB)(暗红色)、初始B细胞(N)(红色)、过渡期的B细胞(trans)(橙色)、浆母细胞(PB)(蓝色)。(C)UMAP展示的不同疾病分期的B细胞区室。(D)B细胞亚型的流式细胞仪分析。CD19+B细胞被CD20和CD27染色。CD20-CD27highB细胞归类为PB, CD20+CD27+细胞归类为MB, CD20+CD27-细胞归类为N。在CD19+B细胞中,每种细胞类型的比例与发病相关,颜色对应相应的疾病分期,并与患者相关(n=7)。(E)UMAP展示的特异性PB,并标出了中性粒细胞细胞(NL)。较小的UMAP对应PB标记(CD27、CD38和TNFRSF17)和中性粒细胞样细胞标记(ELANE、MPO和CAMP)的表达。(F) B细胞区室的细胞轨迹分析。使用Monocle3计算细胞轨迹。以过渡期的B细胞(紫色)为基础,分化为2个分支:B细胞初始支和记忆支(灰色线,最终为黄色)和过度应用的PB支(黑色线,最终为橙色)。(G) 点图显示了PBs中不同疾病分期的特征基因。根据10个最典型的基因的表达增加量来筛选基因。不同颜色表示基因表达增加(红色)或减少(蓝色),点大小代表每组表达相应基因的细胞数量。(H)疾病发展过程中,表达增加的基因的GO富集分析。圆点大小与基因比例成正比,颜色与富集的p值对应。排名靠前的项被可视化。(I)B细胞亚型中目的基因的表达。根据在PB或NL中的高表达来选择目的基因。对于每个基因,顶部小提琴图描绘B细胞亚型的表达,中心小提琴图基于不同疾病分期,底部小提琴图基于队列2的表达(健康对照[白色]、轻症[浅灰色]、重症[深灰色])。(J)B细胞区室亚型富集的代谢通路图中显示了在PBs中重构的环境特异性代谢网络的前20条活跃的代谢通路。针对每个B细胞亚型,使用Kruskal-Wallis检验确定代谢活性的显著性差异。每个通路的反应数以颜色强度表示。

 

7. 巨核细胞数量升高是COVID-19全身炎症反应的一个特征


已知全身炎症反应消耗血小板,而血小板除了具有良好的止血作用外,还发挥广泛的免疫和炎症功能。肺和脑栓塞是COVID-19发病率和死亡率的重要因素。鉴于我们已经在单细胞数据中观察到血小板的细胞来源循环MKs的瞬时增加(图2B),并已鉴定出与血小板计数和D-二聚体水平相关的共表达模块(M3和M4),我们假设MKs的存在和功能改变可能是COVID-19的一个独特的特征。因此,我们使用k近邻法对6,512个被鉴定为MKs的细胞及其各自的造血干细胞前体(HSCs)和巨核/红细胞祖细胞(MEPs)进行了亚聚类(图6A)。这些细胞聚集成两个不同的亚群,5870个被鉴定为真正的MKs,并且另一个较小的亚群包含所有的HSCs和MEPs(图6B)。细胞前体数量相对较低,使个体疾病分期间的比较变得更为复杂;然而,与健康对照相比,我们可以发现恢复期HSCs和MEPs显著增加。

通过重点关注MKs,我们发现健康对照和COVID-19活跃期患者的样本明显不同(图6C),尤其是来自疾病3期(复杂期)的细胞与来自健康和疾病7期(长期恢复期)的细胞形成不同的亚簇(图6D和6E)。我们在危重症(疾病2期)患者中观察到PKM转录本(PKM2)数量明显增加, PKM2编码参与ATP形成的丙酮酸激酶,与HIF1A相互作用并促进其活性。在这一组中,还存在高表达的FCER1G,其编码负责整合素(ITGA2-GP6)介导的血小板粘附的共同的FcRγ链适配体(图6E)。GO富集分析确定了与免疫反应、I型IFN反应和血小板聚集相关的通路,它们随着疾病轨迹发生改变(图6G)。

瞬时降低的转录本,包括ODC1(鸟氨酸脱羧酶)、多胺合成的限速酶和TGFB1(图6F)。在炎症1、2、3和4期,IFITM3、IFI27和IFITM2表达增加,表明MKs中IFN反应贯穿于整个疾病轨迹。此外,我们使用轻症和重症COVID-19的独立队列验证了我们的发现,不仅证实了在重症患者中MKs数量较高,而且证实了在重症患者中IFITM3、PKM、ITGA2B(又称CD41)和IFITM2表达增加,ODC1和TGFB1表达降低(图6F,底部)。

代谢模型发现,与健康对照相比,MKs的代谢活性随疾病轨迹增加,但水平低于PBs(图6I)。显著的预测过程与能量代谢(丙酮酸代谢、糖酵解和活性氧[ROS]解毒)有关(图6J和6I)。代谢模型推断出,合成乳酸的糖酵解通量显著增加、甲基乙二醛途径被诱导和已知抑制血小板聚集的亚精胺-多胺产物的减少。

图6 巨核细胞水平升高是COVID-19的一个特征

(A)工作流程示意图。(B)UMAP展示的MKs及其前体,总共描绘了6,512个细胞。MKs(绿色)、HSCs(粉红色)、MEPs(黄色)。(C)用UMAP展示的不同疾病分期的MKs,总共描绘了5870个细胞。(D)COVID-19疾病轨迹的MKs。对于每个UMAP,疾病分期特定的细胞用彩色突出显示。(E)点图显示了MKs的疾病轨迹特征基因。根据10个最典型的基因的表达量来筛选基因。不同颜色表示基因表达增加(红色)或减少(蓝色),点大小代表每组表达相应基因的细胞数量。(F) MKs中目的基因的表达。顶部的小提琴图基于不同疾病分期,底部小提琴图基于队列2,健康对照(白色)、轻症(浅灰色)、重症(深灰色)。(G)疾病发展过程中,表达增加的基因的GO富集分析。圆点大小与基因比例成正比,颜色与富集的p值对应。排名靠前的项被可视化。(H)按疾病严重程度分组的队列2 MK比例。健康对照(白色)、轻症(浅灰色)、重症(深灰色)。AIC和p值基于线性混合模型。(I)MKs富集的代谢通路。图中显示了重构的环境特异性代谢网络排名靠前的差异活性代谢通路。使用Kruskal-Wallis检验确定代谢活性的显著性差异。每个通路的反应数以颜色强度表示。(J) MKs中的丙酮酸代谢。通过疾病分期描述了丙酮酸代谢途径活性反应的数量。p值基于Kruskal-Wallis检验。每列上面的n为每个疾病分期的模型数

 

8.COVID-19重症患者队列中共表达模块与临床结局的关联


最后,我们使用由奈梅亨大学医学中心(UMC)40名需要机械通气的危重症COVID-19患者组成的纵向队列(队列3),重点研究了所获得的COVID-19特征在临床背景中的潜在重要性。

队列3的大量RNA测序数据是在进入ICU初期的两个时间点获得的。我们使用来自生存者(n=33)和非生存者(n=7)炎症活性增加相似的配对样本,研究了两个时间点之间模块基因(队列1定义的M1-M10,见图4A)表达量的变化(图7A)。第一个样本是在进入ICU后3天获得的,生存者和非生存者时间点之间的中位数为2天没有系统性差异,非生存者的第二个时间点在死亡前4-35天之间。纵向比较,我们发现3个模块被显著调控。在生存者和非生存者中,与I型IFN应答失败相关的M2转录物均显著减少,证实了IFN失调与危重症的相关性。与进入ICU时相比,随访2天后采集的样本中M4转录本和M7转录本,仅在COVID-19非生存者样本中显著增加(图7B)。

使用相反的方法,我们研究生存者和非生存者两个时间点之间有哪些转录本表现出了纵向不同的表达模式。我们发现,在生存者中只有3个转录本被调控,而在非生存者中有182个转录本显著不同(图7C)。这些转录本中有130个包含在队列1定义的即时共表达模块中,与M2、M4和M7相关的转录本显著富集。这些与死亡相关的转录本的细胞类型特异性表达模式(每个细胞类型的平均表达值来自队列1的scRNA-seq)表明,M2基因的特征标志了多种细胞类型,如单核细胞、粒细胞、NK细胞、增殖的淋巴细胞和CD8+T细胞,M3和M4基因多为单核细胞特异性基因,很少有MKs属性的高表达转录本。大多数M7基因属于红系谱系,在MKs中特异性表达,如PBX1、TRIM58和PDZK1IP1(图7D)。

最后,我们使用limma通过moderated t test量化了生存者和非生存者的TFs随时间的差异调控。经分析鉴定出,非生存者中有16个TFs存在差异调控,并且生存者中有7个TFs存在差异调控(图7E)。通路分析(REACTOME)显示,在非生存者的TFs中,“MK发育和血小板生成”(p=0.0001)和“TRAF6介导的促炎细胞因子诱导”(p=0.001),显著富集。

图7 COVID-19重症患者纵向队列共表达模块的临床意义

(A)工作流程示意图。(B) 生存者和非生存者两个采样时间点M2、M4、M7模块特征基因的比较。误差条描述了1.5的四分位间距和*p<0.05(Mann Whitney检验)。(C)火山图显示了,非生存者两个采样时间点之间的差异倍数log2值和FDR调整后的p值。基因根据相应的共表达模块进行颜色编码。较深的颜色表示差异显著。(D)热图显示了,队列1中不同细胞类型的非存活者中DEGs的平均表达(来自scRNA-seq数据)。图中显示了疾病严重阶段(疾病1、2和3期)的平均表达。热图中绘制了平均基因数的z值,并为每个模块进行层次聚类。(E)火山图描述了非生存者(右)、生存者(左)和-log10转换后的p值,随时间变化的TF活性差异。显著的TFs (p<0.1)用红色标记。


讨论


临床上异质性疾病的表现使响应COVID-19的造血和免疫细胞的分子动态成为理解疾病关键点的重要课题。我们的纵向分析提供了在以前横断面研究中观察到的变化的时间顺序。我们观察到NK细胞早期和持久的消耗和CD4+T细胞室淋巴细胞减少。我们的数据证实了单核细胞的持续增加和转移。值得注意的是,在DNAm数据中,我们发现低甲基化位点在顺式转录本中高度富集,与TNF分泌、IL-1β释放和先天免疫信号的正向调控相关的表达增加。反之亦然,表达降低的转录本包括T细胞受体信号转导和ATP代谢的负调控,这表明表观遗传过程可能会导致免疫失调的长期调控。我们观察到PBs的短暂增加与记忆和初始B细胞的相对减少,这与炎症的严重程度一致,并在恢复期恢复正常。与其他研究类似,这些变化与水平无关,但它们会在SARS-CoV-2可识别IgG抗体之前出现。疾病期间,大量PBs上表达CD138支持了这一理论,即这些细胞是非特异性地从骨髓或其他组织中调动出来的。值得注意的是,我们发现在系统生物学建模方法中COVID-19 PBs被预测具有高度代谢活性。观察到的变化表明,PBs具有作为一种营养库的作用,在重症疟疾中,滤泡外PBs已被视作一种系统性炎症反应的标志。COVID-19高峰期预测到可用性能量较低,这可能是由于葡萄糖过度穿梭于抗体糖基化过程,进而可能导致细胞代谢衰竭和/或抗体的糖基化模式改变,这与重症COVID-19相关联。

我们使用纵向方法识别出COVID-19诱导的两种在以前的研究中未被识别出细胞特征。首先,我们发现MKs显著增加,带有强烈的I型IFN特征,这种变化与RNA测序数据中的两个纵向共表达模块(M3和M4)有关。这两个模块都与血清D-二聚体水平呈正相关,这表明炎症诱导的促凝状态是COVID-19患者潜在的致命并发症。IFITM3是MKs中表达增加最高的转录本之一,在MKs和血小板中具有抗病毒活性。代谢模型表明,在高炎症状态下,丙酮酸代谢和糖酵解速率加快,这使血小板对活化和聚集敏感。

虽然血小板减少已被视为重症COVID-19的临床相关因素,但这种变化不太可能与登革热中所见的MKs直接感染有关。我们在MKs中没有发现ACE2表达的证据,在细胞群中也没有发现任何病毒相关的序列。观察到的包括MEPs在内的循环前体细胞的增加表明COVID-19的影响,不仅是对血小板消耗增加的旁观者反应,更可能反映了炎症诱导的紧急巨核细胞生成。我们没有观察到MK水平与血小板数量或D-二聚体之间的直接相关性,这可能是因为scRNA-seq数据集太小。本研究数据集显示,I型IFN信号的持续存在可能会增加血小板的聚集潜能。与此一致的是,在队列1的大数据集中,MK相关的模块M4与D-二聚体水平有强相关性。

第二个细胞特征主要在bulk RNA-seq数据中观察到,与共表达模块M7有关。我们发现一个包含红细胞形成典型成分的转录组的双相上调,这很可能与网织红细胞的存在有关。与缺氧诱导的应激红细胞生成相关的GATA-1 TF结合基序在该模块中显著富集,因为它存在于危重症患者和晚期停止吸氧的患者样本中,我们推断这一特征反映了典型的缺氧反应。几十年来,缺氧后红细胞增多症和血液循环中存在不同的红细胞祖细胞一直被视为骨髓对急性缺氧损伤和危重疾病的反应机制。红细胞祖细胞的动员及其在循环中的存在与增强的免疫反应有关。尽管由于红细胞裂解以及数据处理中的大小和特征过滤步骤,我们并未在scRNA-seq数据中直接分析红细胞,但停止吸氧阶段的2名COVID-19患者的scRNA-seq数据显示,定型红系祖细胞样细胞的存在增加。从基因含量和鉴定的细胞数量来看,这些细胞不太可能代表网织红细胞。总之,这些结果表明,在疾病的不同阶段,红系谱系对COVID-19的反应意义深远,而分析队列3的样本数据表明我们预测的这些疾病轨迹特征与临床结局相关联。本研究表明,队列1中的两个模块,M4(与MK数量相关)和M7(与红细胞生成相关),在独立队列(队列3)中与致命结局显著相关。在生存者和非生存者中,包括单核细胞、NK细胞、CD8+T细胞和PBs在内的多种细胞类型中,M2模块(队列1中,与I型IFN亚型相关)的表达均降低,这证实了在重症COVID-19中观察到I型IFN失效的现象,但其与致命结局的具体关系尚不明确。我们的结果明确表明,巨核细胞和红系细胞中的调节事件可能是不利于COVID-19病程的关键因素,这需要进一步的前瞻性研究。

本研究的局限性在于初始双中心队列(队列1)的样本量相对较低,但我们通过两个独立的验证队列来弥补了这一不足。初步结果指出细胞特征的功能改变,应进行前瞻性验证,而目前只能根据其他系统性炎症疾病机制研究结果来解释。我们没有发现PB数量与SARS-CoV-2识别抗体发育延迟相关的证据,这与先前的报道相符;然而,不能排除广泛的PB激活对其他特异性B细胞反应(如中和抗体的亲和力成熟或记忆形成)的干扰,如重症疟疾中就存在这种情况。代谢过度激活的PBs还需要通过其他方法来证实,但是从B细胞亚群的模型比较来看,在PBs中观察到的模式并没有作为COVID-19常规免疫代谢结果出现;同样,MKs和其他造血前体(例如,粒细胞-巨噬细胞祖细胞)的存在、功能改变和推测的代谢偏向需要在更大的队列中通过正交方法(例如,流式细胞术和增殖试验)得到证实;此类研究也应考虑到微血管并发症(如神经功能障碍)的长期后果。本研究还发现了几种可作为重症COVID-19轨迹标志物的细胞因子(如IL-10和GDF-15),应进行大型前瞻性、纵向生物标志物试验,以提出临床上可用的重症COVID-19轨迹的预测因子。



原文链接:  
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7689306/


微科盟推荐阅读:


综述 | Signal Transduct Target Ther:COVID-19相关肝损伤的病理学特征(国人佳作)

科研 | Nat. Commun.:Tau通过整合素受体激活原代星形胶质细胞


   

如果需要原文pdf,请扫描文末二维码,加助理获取



微科盟视频号来啦

不来关注一波嘛



蛋白组科研学术群期待与您交流更多蛋白组学科研问题

(联系蛋白组学老师即可申请入群)。



了解更多蛋白组学知识,请关注下列二维码。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存